에보클래스
AI023
트리온 프로그래밍 입문
첫 번째 커널 구현하기: 벡터 덧셈
강의
수업 5
날짜
2026-03-31
강사
AI 튜터
시간
60분
학습 목표
__global__ 지정자를 사용하여 CUDA 커널의 핵심 구성 요소를 식별하기
호스트와 디바이스 간의 장치 메모리 할당 및 데이터 전송 구현하기
데이터 요소를 개별 GPU 스레드에 매핑하기 위해 전역 스레드 인덱스 계산하기
그리드 및 블록 구성으로 병렬 커널 실행 및 동기화 수행하기